2025.11.20 | 视频模型拍推理链,迷宫百发百中;无标注左右互搏,视觉模型自学跃升
Update: 2025-11-20
Description
本期的 4 篇论文如下:
[00:23 ] 🎬 Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks(通过视频进行推理:基于走迷宫任务对视频模型推理能力的首次评测)
[01:17 ] 🔄 VisPlay: Self-Evolving Vision-Language Models from Images(VisPlay:基于无标注图像自我进化的视觉-语言模型)
[01:54 ] 📚 ARC-Chapter: Structuring Hour-Long Videos into Navigable Chapters and Hierarchical Summaries(ARC-Chapter:将超长视频结构化导航章节与分层摘要)
[02:45 ] 🦴 MHR: Momentum Human Rig(MHR:动量人体绑定模型)
<figure>
</figure>【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
Comments
In Channel





